Désambiguïsation d'entités nommées par apprentissage de modèles d'entités à large échelle
نویسندگان
چکیده
The objective of Entity Linking is to connect an entity mention in a text to a known entity in a knowledge base. The general approach for this task is to generate, for a given mention, a set of candidate entities from the base and determine, in a second step, the best one. This paper focuses on this last step and proposes a method based on learning a function that discriminates an entity from its most ambiguous ones. We adopt a model that is able to deal with large knowledge bases. Thus our contribution lies in the strategy to learn efficiently such a model. We propose three strategies with different efficiency/performance tradeoff. The approach is experimentally validated on six datasets of the TAC evaluation campaigns by using Freebase and DBpedia as reference knowledge bases. MOTS-CLÉS : Recherche d’entités, Désambiguïsation d’entités, Sélection d’exemples négatifs.
منابع مشابه
Named Entity Recognition and Correction in OCRized Corpora (Détection et correction automatique d'entités nommées dans des corpus OCRisés) [in French]
Résumé. La correction de données textuelles obtenues par reconnaissance optique de caractères (OCR) pour atteindre une qualité éditoriale reste aujourd’hui une tâche coûteuse, car elle implique toujours une intervention humaine. La détection et la correction automatiques d’erreurs à l’aide de modèles statistiques ne permettent de traiter de façon utile que les erreurs relevant de la langue géné...
متن کاملExtraction d'entités dans des collections évolutives
Résumé. Nous nous intéressons à l’extraction d’entités nommées avec comme but d’exploiter un ensemble de rapports pour en extraire une liste de partenaires. À partir d’une liste initiale, nous utilisons un premier ensemble de documents pour identifier des schémas de phrase qui sont ensuite validés par apprentissage supervisé sur des documents annotés pour en mesurer l’efficacité avant d’être ut...
متن کاملA Named Entity recognizer for French (Un reconnaisseur d'entités nommées du Français) [in French]
We propose to demonstrate a french named entity recognizer trained on the French TreeBank enriched with named entity annotations. Mots-clés : REN, POS, apprentissage automatique, French Treebank, extraction d’information, CRF.
متن کاملExtraction automatique d'affixes pour la reconnaissance d'entités nommées chimiques
Résumé. Dans cet article nous détaillons une approche permettant de détecter des affixes et des termes déclencheurs à partir de dictionnaires de façon automatique en se basant sur l’algorithme de la plus longue sous-chaîne commune, dans le cadre de la reconnaissance d’entités nommées chimiques sur CHEMDNER. Nous verrons ensuite des méthodes de sélection et de tri afin de les intégrer au mieux d...
متن کاملCadre d'évaluation de systèmes de reconnaissance d'entités nommées spatiales
RÉSUMÉ. La reconnaissance d’entités nommées est une tâche de l’activité d’extraction d’information dans des corpus textuels. Des systèmes de reconnaissance d’entités nommées spatiales sont très largement utilisés, mais souvent sans en connaître les forces et faiblesses. C’est pourquoi nous proposons le cadre d’évaluation SNERBM (Spatial Name Entity Recognition BenchMark) comme référentiel commu...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2017